内発的動機づけ型強化学習(intrinsically motivated RL)
餌やお金などの
外的報酬(extrinsic rewards)
は現実世界では
疎(Sparse)
にしか存在しない
この問題に対処するため、以下のような
内的報酬(intrinsic rewards)
も利用して行動を決定する
強化学習(Reinforcement Learning; RL)
新規性(novelty)
サプライズ(surprise)
情報利得(information gain)
Intrinsically Motivated Reinforcement Learning: An Evolutionary Perspective|IEEE Trans Auton Ment Dev(2010)